查看原文
其他

量子计算在粒子物理学中的应用路线 | 综述荐读

光子盒研究院 光子盒 2023-11-30
光子盒研究院


量子计算机为自然科学及其他领域的计算模式变革提供了一条引人入胜的道路,有可能实现量子优势——即显著(在某些情况下呈指数级)加快数值模拟的速度。具有各种量子比特的硬件设备的快速发展使得在量子计算机上执行小规模但有代表性的应用成为可能。
特别是,高能物理界在利用量子计算能力方面发挥着举足轻重的作用,因为该领域是挑战性计算问题的驱动源。在理论方面,这涉及对经典技术很难、甚至不可能解决的模型的探索;在实验方面,可以应对新出现的实验(如大型强子对撞机的升级)所面临的巨大数据挑战。
近日,欧洲核子研究中心(CERN)、德国电子同步加速器研究所(DESY)和IBM等30大组织牵头,联合撰写了一份路线图文件,详细介绍了高能物理量子计算的现状与展望
“Quantum Computing for High-Energy Physics: State of the Art and Challenges. Summary of the QC4HEP Working Group”
/目录/
一、高能物理量子计算的理论建模二、相关算法实践三、一系列有趣的理论挑战3.1. 实时现象模拟3.2. (2+1)D 量子电动力学3.3. (2+1)D 量子色动力学3.4. 量子链路模型和D理论3.5. 中微子振荡四、部分实验应用4.1. 稀有信号特征提取4.2. 模式识别任务:重建粒子轨迹和粒子射流4.3. 可解释模型和推理4.4. 用于模拟的生成式模型五、NISQ时代的相关挑战、机遇

尽管经典晶格场理论取得了巨大的成功(例如,用于量子电动力学(QED)和全色动力学(QCD)模拟),平衡态外和实时动力学(real-time dynamics ,例如,粒子碰撞、热化现象或淬火后的动力学)仍然是欧几里得路径积分蒙特卡罗模拟所无法企及的。
此外,高费米子密度下的中子物质的性质,例如在中子星或宇宙早期出现的中子物质的性质,也无法通过这些经典模拟技术获得。  
同样的道理也适用于具有拓扑项的理论,这些拓扑项在QCD中对于理解CP违背的数量,或者在弱电子部门中理解早期宇宙中的sphaleron速率都是相关的。这些限制源于臭名昭著的符号问题(sign- problem):在实时现象中,在具有高费米子粒子密度的系统中;或者在存在拓扑项的情况下,产生的路径积分的高度振荡行为意味着随着晶格点数的增加,采样运行时间的复杂性呈指数增长。
规避符号问题的另一种方法可能是用等效的哈密顿形式来描述晶格场理论,而不是基于拉格朗日形式的路径积分描述。然而,在哈密顿方法中,必须存储描述整个晶格上粒子状态的、总的多粒子波函数。但是,由于包含这些一般态的总分解希尔伯特空间H相当于单个晶格位点上的希尔伯特空间Hj的张量乘积,因此,在晶格上存储一个完整波函数所需的内存与晶格位点的数量成指数关系。
近年来,基于张量网络的新方法被引入、并通过在晶格上更紧凑地表示一般量子态来缓解这些限制。允许进行哈密顿模拟的基本机制是张量网络(TN)方法,它可以精确地识别和关注这些有物理意义的子空间。因此,利用张量网络技术,学者们至少在一维空间模型中的几百个晶格位点上研究了各种现象:如断弦(string  breaking)和实时动力学、或有限费米子张量下的阿贝尔和非阿贝尔规范场论的相图。
量子计算机可以用比特(信息的基本单位)来表示大的希尔伯特空间,所需的比特数与晶格点数成线性增长。此外,量子算法已经被提出,可以在标量量子场理论和QED中以多项式时间复杂度实现实时动力学;通过与张量网络共用哈密顿公式,量子计算完全避免了符号问题。因此,量子计算机提供了一个潜在的框架,可以完全克服上述格点规范场论(lattice gauge theories)模拟的局限性,特别是实时动力学
事实上,在过去的几年里,在不同类型的量子硬件上实现一般阿贝尔和非阿贝尔格点规范场论(Lattice Gauge Theory, LGT)的各种建议已经积累了很多,在真实的量子设备上对小型LGT系统的模拟也已经得到了证实。
例如,利用光学晶格实现晶格规律理论的提议、原子和超冷量子矩阵、在真实超导结构上的进一步原理验证实现,以及最终在捕获离子系统上实现量子电动力学 的(1+1)维((1+1)D)实时和变分模拟。值得注意的是,格点规范场论可以通过许多不同的物理体系和方法来实现,每种方法都有自己的优缺点。
理解(3+1)维((3+1)D) LGT的静态和动态特性,包括QED和QCD,并不是当今理论粒子物理的唯一目标。事实上,我们必须考虑一个令人兴奋但也要求苛刻的路线图,以最终实现对与HEP相关的(3+1)D系统进行量子模拟的目标。这个路线图从现在正在积极研究的(1+1)D系统开始,到现在不同研究小组正在考虑的(2+1)D系统,再到将来的(3+1)D系统。
(1+1)D和(2+1)D维的低维系统已经非常有趣。它们与高维系统共同面临着重要的挑战性问题。
一个重要的例子是(2+1)D QED的研究,它显示了渐近自由(asymptotic freedom)和约束现象(confinement)。渐近自由是QCD(即夸克和胶子之间强相互作用的量子场论)的一个特征。在高能量极限(使用自然单位时距离较小),夸克的相互作用变得很弱,这使得微扰理论非常适合理论预测;相反,在低能量时,相互作用变得很强,从而导致粒子束缚。有趣的是,还有一些低维的LGT,它们的约束现象也是已知的,这有助于揭示理论上更难的QCD约束机制(因为维度大,自由度多)。如上所述,(2+1)DQED就是这样一个模型,它是一个紧凑的U(1) LGT。因此,可以提出一个低维度的模型,作为探索量子通信在近期、噪声机制中的潜力的基准。

HEP实验的特点是,通过在量子理论和精密实验之间的前沿进行测量和分析,能够探究标准模型和标准模型之外的粒子物理学的复杂性。  
在基本粒子尺度上进行的实验的统计精度取决于三类算法:
1)探测器操作算法(Detector operation  algorithms)使探测器能够有效地获得数据,这些数据能够清晰地反映物质的基本相互作用。这些探测器可能具有非常大量的高维数据,例如在强子对撞机中发现的数据。这些探测器需要用算法将重要信号从噪声中分拣出来。基于探测器的算法还可用于帮助推断非常罕见过程(如中微子或预期的新物理相互作用)的特定测量的更完整特征。
- 识别和重建算法是将大量的像素强度、时间和事件计数映射到数据中连贯的基本物理结构的重要组成部分。这些算法可以将数据集划分为与特定物理目标相关的特定过程或状态,因此必须是稳健、高效和无偏的。
- 强大的模拟和推理工具允许部分物理实验将大量复杂、高度结构化的数据与参数化的理论预测进行比较。这些算法包括创建模拟数据集,用作参数统计模型的模板;分类工具,用于提高给定测量对某些过程的灵敏度;或识别可能暗示新物理源的统计异常信号。
QC包含了对实验性HEP特别重要的几个决定性特征:处理时间的量子加速潜力、对数据相关性来源的敏感性以及量子系统表达能力的提高。 上述三类算法中的每一类都能从上述三个特点中获益。在高亮度加速器上运行的实验需要更快的算法;识别和重构算法需要捕捉信号中的相关性;模拟和推理工具需要表达和计算经典上难以处理的函数。
在现有的数据重建和分析范例中,获得量子加速算法将彻底改变大规模量子系统的模拟和复杂实验装置的数据处理。这将使新一代的精确测量能够更深入地探究宇宙的本质。现有的测量可能包含经典分析技术无法获得的潜在量子关联或其他新物理学来源的特征。与经典算法相比,利用这些特性的量子算法有可能从给定的数据集中提取更多的信息。最后,它们能够捕捉HEP理论和模拟的更复杂方面的算法可以提供更符合标准模型量子力学性质的估算器,甚至有可能发现经典模型无法解释的新物理。
由于可以利用量子系统的独特性质来实现组合优势的算法,用于HEP的量子计算特别令人感兴趣。大多数有望获得超多项式优势的量子算法都利用了量子计算机高效模拟量子多体系统的能力。量子算法可以利用具有正确基础结构的计算问题,从而加速寻找潜在的量子优势。HEP领域的应用显然可以为此类测试案例提供可控的实验基准。通过分析使用量子算法的HEP实验数据,研究人员可能能够深入了解量子系统的行为,并有可能确定量子优势的新途径。
HEP实验数据通常被组织成相关探测器信号的集合,这些信号可以被重组为测量粒子。这些粒子测量值的分布可根据基础理论的特定参数化进行计算,这样实验数据的分布可通过使用模拟数据直接与理论预测进行比较。这些参数化使得数据能够最大限度地描述量场理论中定义的任何给定过程的特征。这种参数化方法使得测量仪的精度能够随着重复测量的进行而持续有效地提高。  
因此,尽管高能物理实验中记录的数据提供了基本粒子行为及其相互作用的信息,而这些信息又是由量子场及其受量子力学原理支配的动力学所描述的,但重要的是要注意到,典型的数据及其描述在本质上是经典的,因此可能并不完全表现出量子优势所必需的量子力学特性。
总之,通过使用量子信息论和粒子物理学的工具和技术分析实验数据,我们可以深入了解宇宙的有趣本质,并有可能发现尚未被理解的新现象
拟议的理论物理模型系统(橙色)与相应的方法(绿色)和量子算法(蓝色)。 



在本节中,我们将介绍不同理论领域中一系列有趣的理论挑战,包括多粒子物理、不同性质的微观规理论和中微子物理。 
1)实时现象模拟
高能物理实验室(如大型强子对撞机)的实验结果以对撞产物数据的形式出现。正是通过散射过程,我们在实验中获得了对基础物理学的深刻理解,通常是通过重新构造在散射事件的中间阶段组装起来的复合准粒子,并将它们的性质与标准模型(及其他)的理论预测进行比较。
然而,这类预测显然存在一些局限性。
- 首先,它是间接的,因为它比较的是观测到的复合准粒子特性,而不是散射事件分布本身;
- 此外,这种准粒子的解析计算仅限于通过摄动理论以费曼图的形式进行的计算,因此无法对量子色动力学部门进行准确的预测,因为该部门远非微扰(perturbative)。对散射现象进行精确模型预测的一个重大障碍是,蒙特卡罗方法擅长于捕捉平衡特性,但在处理非平衡实时性时受到阻碍。
由于符号问题和复杂的数值积分动作,蒙特卡罗方法在处理失衡实时动力学时受到阻碍。
从这个角度看,获得非微扰多体实时模拟的直接数据将实现完全的范式转变。模拟可以立即提供产品的统计数据,这样我们就可以立即将它们与从高能实验室收集到的事件的观测统计数据进行比较。 
哈密顿形式的格点规范场论非常适合这一任务:虽然空间维度被离散化(通常为立方晶格),但时间被保持为连续变量,因此多体实时演化算子对于任意时间间隔都是形式上定义明确的。在此框架下,可以安全地接近连续极限,而不必担心紫外发散。然而,数值计算这样的演化算子及其对任意输入状态(例如收敛的类粒子波包)的作用,在晶格系统大小上是一个指数级的难题,需要借助量子模拟器或量子启发的数值算法来进行良好的近似计算。
模拟和数字量子模拟器策略都可用于推动这一目标的实现。在任何一种情况下,实时演化算子都应用于一组量子比特(或更广义的量子比特),这些量子比特编码多体量子场状态。模拟量子模拟器通过实现瞬时可控哈密顿来模拟目标模型哈密顿,该哈密顿在选定的能量尺度上等效于目标哈密顿,然后让系统通过与时间无关的控制演化。 
这种方法本质上是可扩展的,但它受制于可设计的相互作用类型。相反,数字量子模拟器的目标是将时间演化的作用分解为量子操作电路(例如门)。这种方法更具通用性,尤其是当量子资源形成一组通用门时,但它在可扩展性和一致性方面可能会受到限制。事实上,进行这种模拟所需的量子比特数和电路深度在很大程度上超出了当前近期噪声量子器件的能力。
除了基于量子硬件的方法,张量网络也可以作为一种数值策略,它与量子模拟器一样,工作在相同的晶格哈密顿框架(离散空间,连续时间)上。张量网络擅长描述平衡状态下的晶格量子态,即使在多空间维度和有限密度下也是如此。此外,只要纠缠产生较少(即不违反纠缠的面积律),它们就能准确捕获平衡态外的动力学。虽然这似乎是一个严格的要求,但它实际上是一个无处不在的现象,从多体局域化,到跨相变的缓慢淬火(Kibble-Zurek机制),到Lieb-Robinson约束下的短时标暂态现象(short-timescale transient  phenomena)。
当使用经典或量子模拟专门解决散射问题时,在执行多体动力学这个已经很严重的问题上又增加了一个额外的概念复杂性:准备输入状态(preparing the input state)。

粒子对撞机实验中的初始量子态通常是复合准粒子的局部波包,例如强子。在基本量子场中,这些波包具有明确的质量中心动量和总体数量密度(通常为一个准粒子),但其内部波函数可能非常复杂。 
显然,散射模拟必须包括从(纠缠的)穿透真空开始,通过仔细操纵编码为量子比特的元素量子场来建立这些状态(并控制它们的动量)的策略。请注意,当有可能在未来的量子处理器中研究散射过程时,这个问题仍然存在。因此,为张量网络开发的任何部分或最终解决方案对于未来的量子计算和散射过程模拟都将非常有价值。
2)(2+1)D 量子电动力学
(2+1)D QED是最简单的量子场论之一,但却保留了有趣的物理特性:例如,它与QCD共享诸如渐近自由度和约束等重要特性,而且它是未来分析更复杂理论的绝佳起点。因此,(2+1)DQED可以作为一个非常合适的基准和试验台模型来探索量子计算的潜力,特别是将它与TN计算进行比较。
目前,格点规范场论数值研究最常用的经典方法是马尔可夫链蒙特卡洛(MCMC)方法,虽然MCMC可以达到1003×200的晶格尺寸,这在目前的QC和TN技术中是不可想象的,但后者使用的哈密顿公式有几个优点。例如,MCMC在连续极限时会有非常大的自相关时间;在晶格间距很小到非常小的情况下,我们可以利 用量子计算或张量网络的方法。此外,MCMC所使用的欧几里得路径积分存在臭名昭著的符号问题,这使得在费米子密度不为零的情 况下无法研究量子场论。 
更具体地说,对于格点QCD来说,这阻碍了对非零重子密度相图区域的探索和表征,而这些区域与早期宇宙、中子星或向夸克-胶子等离子体的过渡有关。 
另一个重要方面是经典MCMC技术在拓扑项预设方面的限制,与此形成鲜明对比的是,拓扑项可以直接用哈密顿公式处理,即用QC或TN。最后,哈密顿方法将能够研究实时现象,如散射过程、热化或淬火后物理系统的动力学。
量子信息科学与技术的另一个支柱是模拟量子模拟器,它允许对各种量子多体现象进行直接实验。鉴于量子模拟器技术的最新进展,如通过气体显微镜进行单原子重吸收、以及总体上的高精度和高控制水平,量子模拟器已成为探测高能现象的一个极具吸引力的场所,它具有在系统动力学的任何阶段都可以获得时间快照的宝贵优势。
量子模拟器的工作方式是将一个由哈密顿Hˆ0描述的目标模型映射到另一个可在实验平台上实现的量子模型上。这种映射几乎从来都不是精确的,但会导致一个有效的模型,其中Hˆ0在摄动理论中产生到前导阶,同时还有(不希望有的)次导项λHˆ1,强度λ<1。在量子理论的背景下,模型Hˆ0承载了由局部算子Gˆj产生的量子对称性,而Hˆ1明确地打破了它。
尽管这些实验本身具有开创性,但它们仅限于构筑块,并且受到不受控制的非导规非不变过程的影响,从而限制了有用的相干时间。
3)(2+1)D 量子色动力学
考虑到量子色动力学的长远目标,考虑非阿贝尔场论是非常重要的。具有SU(2)轨则对称组的Yang-Mills理论自然是第一步。格点规范场论的标准Kogut- Susskind汉密尔顿公式定义为:

以量子比特为基本自由度,在通用量子计算机上模拟格点规范场论的问题得到了一般性的定义。文献表明,任何空间维度的格点规范场论都可以在量子硬件上模拟,使用的门数是格点数、玻色场截尾(bosonic gauge field truncation)和模拟时间的多项式。
其他方法使用量子模拟器来模拟非阿贝尔规范场论物理。在这些模拟中,轨则不变性是量子模拟器的某些基本对称性的直接结果。例如,角动量守恒被用来实现SU(2) Yang-Mills 模型、碱土原子中的自旋守恒被用来实现SU(2) Yang-Mills 模型。
在这方面,量子链路公式(quantum link formulation)似乎是非阿贝尔模型量子模拟的自然公式,它是在基于里德堡的结构和超导电路中提出的。

在实现非阿贝尔规范场论模型时,局部自由度基础的选择非常重要。通常,我们需要研究离散化或截尾对模型物理结果的影响。对非阿贝尔理论进行离散化的一个选择是使用有限维子群,这可以在里德堡基础结构中有效地实现。 
即将进行的计算可以借鉴这些初步研究的经验,并随着NISQ时代量子硬件部署的持续进展而扩大规模和范围。
4)量子链路模型和D理论
D理论是格点场论的另一种表述,其中连续的经典场被离散的量子自由度所取代,而量子自由度则通过短维度的额外维度进行降维。  
在D理论方法中,格点场论是通过量子链路模型实现的。量子链路是广义的量子自旋,具有精确的规律对称性,位于空间晶格的链节上。量子链位于嵌入代数的有限维不可还原表示中。这与标准的威尔逊型晶格规对称不同:后者是基于每个链接上的无限维表示。
最简单的阿贝尔U(1)量子链路模型是用普通量子自旋1/2来实现的,它可以用单个量子比特来体现。量子电路已经以资源高效的方式表示了这些动态。在三角形晶格上实现U(1) 量子链路模型特别简单,因为它利用了IBM Eagle 127量子比特芯片的重六面体晶格拓扑结构。
最简单的非阿贝尔SU(2)量子链路模型使用嵌入代数Sp(2) = SO(5),它有一个4维的基本表示,可以由驻留在每个晶格链路上的一对量子比特来体现。通过精确的对偶变换,这个SU(2)量子链路模型可以用Z(2)值高度变量来表示,甚至可以用独立的量子比特来体现。 
从凝聚态的角度来看,这个模型也很有趣,因为它与Kagom´e晶格上的量子二聚体模型密切相关,后者具有丰富的非三维相结构。为了对SU(2)规理论的实时动力学进行量子计算,构建一个类似于三维晶格上U(1)量子链路模型的量子电路将是非常有趣的。
5)中微子振荡
中微子在极端天体物理事件中起着核心作用,如核坍缩超新星和中子星双星合并,因为它们主导着能量、熵和轻子数的传输。中微子将经历不同成分(νe,νµ,ντ)的群体振荡。
鉴于电荷-电流反应的重要性,详细了解这些集合中的味转换(flavor oscillation)对于预测它们的动力学演化至关重要。由于中微子在这些环境中的高密度,味转换受到中微子-中微子两体相互作用的强烈影响,这使得中微子云成为一个强耦合的多体系统。在经典模拟中,直接求解一般初始条件下的演化方程是指数级困难的,传统的方法是依靠平均场近似,然而,平均场近似并不包括中微子之间的直接散射。
中微子物理的复杂性即使在只有两种味(电子味 νe和一种重味νx)参与振荡的简化假设下仍然存在。根据这一假设,我们可以将每个中微子建模为一组相互作用的两级系统,并得到下面的哈密顿方程:

上式可以用来描述在固定密度下均匀气体中微子的味转换。然而,大多数中微子正在离开它们产生的发射体(中子星,......)的爆炸区域,因此当它们向外移动时会经历不同的局部条件。  
这可以通过允许耦合常数λe和µ随中微子发射距离r的变化而变化,或者等效为随中微子离开中微子球的时间t的变化而变化(中微子被认为是以近似光速运动的超相对论粒子)。
目前在这些平台上描述中微子的尝试仍然局限于初始条件相当简单的小N值,通常是描述非相关中微子的波函数。  除了描述更大的中微子数目,未来应用的挑战还包括扩展到更现实的初始条件,如初始热化中微子、或这些相关系统在更长的时间内的演化,以提取例如中微子之间的渐进纠缠或描述热态的弛豫动力学。
在短期内值得研究的另一种可能性是使用基于变分时间演化(VTE)的方法,这种方法允许电路深度与演化时间无关。

高能物理实验的特点是需要处理大量复杂、高度结构化的数据。 
从历史上看,大型合作组织一直依赖于大规模并行计算基础设施,并通过大型强子对撞机计算网格开创了分布式计算。寻找小产生截面过程的需求与下一代探测器一起,产生了大量需要分析的数据集,这就需要新的计算模型、更高效的算法(包括数据驱动技术,如人工智能),以及超越冯-诺依曼架构的新硬件集成。
正是在这一背景下,有关在HEP实验中引入量子计算的研究才得以展开:该领域正在研究如何加速或改进数据分析和数据处理链的不同步骤。
目前,大部分工作都集中在量子神经网络(变异算法)或量子神经方法的量子神经学习(QML)算法的开发和优化上。 
然而,需要注意的是,评估 QML 算法在 HEP 数据上的性能需要小心谨慎:现实应用的要求并不容易在量子设备上实现。事实上,引入量子算法(尤其是QML)的研究需要考虑到需要分析的事件总数(可轻松达到数十万)和每个单个事件中的大量输入特征(通常为数十或数百)。 
目前的首选方法是混合方法:使用经典特征提取和/或降维步骤,将经典输入的大小调整到可以在NISQ量子硬件上实际嵌入的大小。  
根据数据集和任务的复杂程度,使用不同的方法,从线性PCA到非线性训练嵌入或压缩方法(自动编码器或其他基于人工智能的技术)。后者的优势显然在于其通用性,并且可以针对手头的特定任务与量子算法一起进行训练。
此外,量子算法设计和优化过程的一个关键部分是减少量子算法执行任务所需的输入特征的数量,同时定义最小训练集,该训练集仍能确保一致性和泛化能力。
最后,压缩的经典数据被嵌入或加载到量子态中,供QML算法处理。这一步通常称为状态准备步骤。现在,已经研究了不同的技术,这些技术在最佳利用量子比特态、充分利用潜在的指数优势和在噪声器件上有效映射态准备电路的需要之间进行了折中。一般来说,数据嵌入策略的选择对整个算法的性能和算法之间的相互作用都有影响。
总之,这些步骤使得为典型数据处理链中的大多数任务设计和实现量子算法成为可能。
1)稀有信号特征提取
从背景事件中提取罕见信号是HEP实验中寻找新现象的数据分析的重要部分。
作为一项分类任务,稀有信号提取面临着信号类样本数量与背景类样本数量的不平衡问题。入门级的情况是单个特征就足以分辨出感兴趣的过程,而更复杂的情况则需要对许多特征进行多变量分析,以达到合理的分辨能力水平。
在机器学习领域,从不平衡数据中学习的技术已经成熟,对于HEP情况,已有开发的分析方法已经得到有效实施。异常检测(anomaly detection)是利用不平衡技术进行分类的另一种方法。
在粒子物理领域,与其他科学领域一样,如果不提供不确定性,那么预测结果几乎是不完整的。
使用分类器的准确率作为罕见事件的度量标准可能会产生误导,因为它在分布和特征重要性方面对信号一无所知。ROC曲线是一个很好的通用指标,提供了一系列阈值下的真假阳性率信息:ROC曲线下面积(AUC)是一个很好的通用单数指标。然而,在处理不平衡数据时,精确度-召回曲线是首选指标,其中召回代表有多少真正的信号事件被实际识别为信号,而精确度则量化事件真正成为信号的可能性,并取决于信号的罕见程度。 
可以采用不同的策略,如对多数类采样不足或对少数类采样过多,其中前者是首选,因为过多采样可能导致过拟合。此外,标准算法还可以通过改变损失的超参数和增加对错误分类的额外惩罚进行修改。例如,根据已有文献,用于二元分类的交叉熵损失函数的改进版本是焦点损失函数(focal loss),用于区分易分类样本和难分类样本: 

这里,pt是模型估计的给定事件属于信号类别的概率,γ是调制参数。随着γ的增大,易分类样本的下加权率也随之增大。  
如前所述,不仅要保证分类的效率,还要保证相关预测的不确定性。目前的方法包括在深度神经网络中作为近似贝叶斯推断的丢弃训练、训练过的深度神经网络集合的方差估计以及概率随机预测。例如,这种技术被用于测量同源WW散射中的纵向极化分数,以及希格斯玻色子衰变为粲夸克对。
在大型强子对撞机上的同源WW产生是矢量玻色子散射(VBS)过程,具有最大的电弱-QCD产生比。因此,它为研究已发现的希格斯玻色子是否会导致单元纵向矢量玻色子散射(VBS)以及寻找标准模型(BSM)之外的物理学提供了一个绝佳的机会。要证实或反驳VBS的单元性,不仅需要测量pp → jjW ± W±,还需要测量这些事件中两个W都被纵向极化的部分(LL部分)。  
人们自然会问,量子计算算法是否可以用来支持这些复杂的任务?然而,与这些经典方法相比,量子算法在哪些方面能够提供系统性优势并不明显。
可能的研究方向应回答以下问题:
- 我们能否克服这些问题的密度不足或信息不足问题? - 我们能否更好地探索和分析描述这些问题的特征空间?- QML方法采用量子模型将输入数据编码到高维希尔伯特空间,并从量子态中提取感兴趣的物理特性,这种方法能否成为信号检测的另一种方法?  
量子方法的一个特别引人关注的方向可能是在实验数据上进行直接训练,这些数据可以直接作为量子数据进行分析。
总之,在HEP实验中没有明显的新物理迹象的情况下,数据驱动的、模型无关的罕见信号搜索已经获得了相当大的科研兴趣。使用无监督机器学习实现的异常检测是最常用的技术,并将继续在HEP分析工作流程中发挥重要作用。
总体而言,目前用于稀有信号提取的量子-经典混合QML主要基于两种算法:VQA和带核方法的QSVM。
基于量子核的QSVM由于具有凸代价函数景观,因此具有良好的可训练性,这一特性对于100 ⊗ 100挑战是有益的。然而有人指出,除非 U(x)设计得当,否则核函数将随着量子比特数的增加以指数形式集中到一个固定值,这与 VQA 中的“贫瘠高原(barren plateau)”现象类似。

随着100⊗100 IBM的挑战,克服贫瘠高原可能是QML应用于信号提取的关键。基于几何量子机器学习(GQML)的方法,利用问题的先验知识,如手头数据中的对称性,将很有希望应用于HEP数据分析。 
然而,实验数据是由不同层次的相互作用(从粒子喷射到探测器效应)所产生的复杂卷积效应的结果。这将最终破坏数据的任何理想对称性。另外,过度参数化的量子模型可能具有理想的成本景观。这促使我们在现实的HEP数据分析流程中探索GQML模型和/或超参数化。我们还应该研究量子模型如何在可训练参数较少或训练数据较少的情况下有效地生成未见测试数据,并考虑重新使用经典机器学习中众所周知的技术的可能性,例如集合(ensemble);其中,噪声的影响可以通过算法的结构来调节。
2)模式识别任务:重建粒子轨迹和粒子射流
实验数据处理链中的多个步骤可以归纳为模式识别的一般类别,或者说,给定一定数量的对象测量值(如探测器中传感器测量的原始能量,或其空间共线坐标),将它们与特定实例联系起来的问题:例如,粒子轨迹、粒子类型、源自特定粒子(射流)强子化的部分射流。在HEP中,这个问题具有很高的维度,因为探测器传感器是以高度颗粒化的结构排列的,对象代表物理属性,对象类别通常是排他性的(一个能量沉积只属于一条轨迹)。带电粒子的重建和射流的重建,以及它们的属性识别,就是两个很好的例子。
跟踪是 HEP 事件重建的重要组成部分。粒子轨迹候选点是由带电粒子穿过敏感探测器材料时留下的能量沉积(或命中)所对应的空间点建立的。此后计算出的轨迹参数(如位置和曲率)将用于整个数据重建和分析的后续处理步骤,以计算物理观测值。
在对撞机粒子物理学中,射流是稳定粒子聚集成一个大致锥形的区域。喷流产生于高能对撞中产生的夸克和胶子的碎裂。喷流在对撞机物理学中已经并正在发挥着基础作用。e+e-对撞中的三个射流事件证明了胶子的存在。现在,由重夸克(即b和c夸克)碎裂产生的喷流对于一些研究,特别是确定希格斯玻色子耦合至关重要。
最近几年,人们开发出了一些工具来分离不同种类的射流。
- 轨迹重建 
当前和未来的几个HEP实验将探索高强度的情况下,去到极端的状态,成千上万的带电粒子穿过敏感的探测器的一平方厘米。此外,根据所研究的过程和探测器的布局,每个轨迹可以由不同数量的测量组成。输入空间点的可能候选轨迹的多重性与命中次数成四等分或三等分关系。
因此,需要对输入空间点进行严格选择,以缩小搜索空间。尽管如此,轨迹重建是HEP实验中占用CPU时间最多的实验之一,这极大地推动了新型方法的研发。
已经提出了多种方法来解决跟踪问题,大致可分为全局和局部方法。全局跟踪方法将轨迹重建作为一个聚类问题来处理,从而一次性考虑所有空间点,而局部跟踪方法通常由一系列连续执行的步骤组成。
在量子计算机上解决粒子轨迹重构问题的首批建议集中于将该问题转化为量子无约束二值优化(QUBO)问题
经典的图神经网络(GNN)方法被证明与输入空间点数具有线性比例关系,这使其成为未来粒子轨迹重建算法实现的有力候选。尽管没有正式的证据证明这种缩放是线性的,但经验证据表明是这样的。这种改进很可能来自于图形处理器(GPU)的并行能力:这意味着仍然需要大型GPU集群。  
如果具有类似特性的GNN可以在量子计算机上实现,那么量子优势就可以实现。 最近的研究表明,量子经典混合图神经网络(QGNN)方法是可行的,它可以在多达16个量子比特的情况下发挥与经典等效的类似性能。然而,要了解这种方法能否大规模实现,需要更多的量子比特。100 ⊗100器件的出现将能够研究具有100个位点的更大规模的局部哈密顿,并为研究人员提供一种工具来研究基于QUBO的方法是否可行。同样,这样的装置将使我们能够实现与典型的最先进模型相当大小的QGNN。
关于局部方法,尽管由于硬件的限制,目前还无法实现完整的分析链,但我们可以考虑进行复杂性分析,以阐明经典和量子网络的一般演化。
100⊗100的机器可能允许沿着[206]中定义的路线取得一些进展,尽管有必要研究可有效用于执行程序的量子比特的数量。此外,由于适用于经典/量子混合方法,因此可以根据可用资源来实现程序。无论如何,重要的是要记住,在短期内轨道重构算法将受到输入大小的相当大的限制,在QAOA或喷流聚类方面的投资可能更有价值。
- 射流重建和识别 
射流聚类算法旨在估计引发射流的粒子的运动学特性。通常,这些算法都是基于聚类方案,将所观测到的粒子组合成一个射流,以便进一步研究。
聚类算法具有不同的性质和特点,可以使它们更适合于特定的任务,如提取观测值或作为提取最终状态特定性质的工具。
为了减少这些聚类程序的计算开销,人们探索了量子辅助算法。针对电子-正电子对撞的特殊情况,采用了两种聚类技术:i)第一种方法以基于Grover算法的通用量子计算集为目标。此外,还开发了适用于退火的推力QUBO公式。ii)另一项有前途的研究涉及三种聚类算法的量子版本:K- means、亲和传播和kT喷射(kT  jet)聚类算法。  
量子算法被应用于典型的大型强子对撞机碰撞设置的模拟数据,并获得了与经典算法相当的效率。
事实上,喷射标记特征相关性被视为经典相关性,而在QML中,这些相关性可以被理解并包含在电路优化中,从而提高分类性能。 

3)可解释模型和推理
量子模型如何作为推理工具使用,以提取HEP中数据集的特征属性?
我们举两个例子:通过粒子分布函数(PDF)描述强子的非微扰结构,以及估计有效场理论(EFT)的威尔逊系数及其相关性。这些工具在实现物理现象精确建模方面的潜力,并为能够在量子计算和量子信息领域架起桥梁迈出了第一步。
在高能物理中,微扰理论被用来计算高能粒子的相互作用。这些微扰方法允许以耦合常数的幂级数展开来计算散射振幅。然而,随着相互作用能量的减小,耦合常数变得很大,微扰扩展就会失效。这就形成了一个非微扰体系,在这个体系中,基本物理过程不容易计算,而必须通过实验测量或数值模拟来获得。
PDF是非微扰效应的一个例子,它必须通过数据的近似来描述。PDF描述了质子内部夸克和胶子携带的动量分数的概率分布。之所以需要PDF,是因为质子是一个由夸克和胶子组成的复合粒子,它们在不断地相互作用,这使得仅用微扰方法来计算这些粒子的动量分布是不可能的。尽管如此,从量子色动力学(QCD)的基本原理中可以推导出PDF形式的已知约束,并且它们的预测受到实验的高度约束。
准确估计PDF对于对撞机物理实验中的所有测量都是至关重要的,因为它们被用来预测过程的速率和分布。不确定性来自于实验数据用于约束PDF的有限精度,以及如何从拟合PDF中提取相关估计值的理论不确定性。量子计算为我们提供了解决这两个缺点的新途径,它提供的特征函数可以更好地代表它们所代表的过程的性质。
最近的一项研究调查了一种基于参数化量子电路(PQC)的方法,用于从数据中估计PDF的函数形式。PQC方法的目的是找到一种将PDF表示为PQC的解析,使用经典优化算法对其参数进行估计,以最小化预测数据和实验数据之间的差异。这是利用PQC的表达能力来高效学习经典难解问题的解决方案的一个很有前景的途径,显示出与通过经典优化技术获得的现有 Parton 分布函数(PDF)拟合结果的良好一致性。
这代表着在使用量子算法进行PDF估计方面迈出了激动人心的第一步,并凸显了量子计算在解决高能物理问题方面的潜力。
然而,要充分利用问题的量子性质还需要做大量的工作。在这种结构中,被估计的PDF仍然是一个内在量子系统的经典近似,因此这种方法的可能优势纯粹是计算上的。可以预见的是,描述经典难解过程的量子函数是可能的,尽管相对于完全数值模型(例如来自晶格QCD)有所简化,但与数据相比,会比经典模型有明显的改进。
与计算给定标准模型过程的精确预言的实验测量不同,EFT提供了一个框架,用简化的相互作用层次来模拟复杂的物理过程,并用一组威尔逊系数(Wilson coef-ficients)来表征。这些系数代表了各种算子的耦合强度,编码了高能物理效应,可以通过与实验测量结果的匹配过程来确定。虽然威尔逊系数的精确值无法精确计算,但可以通过函数近似的过程来近似它们,在这个过程中,对有效场理论(EFT)的形式进行反演,从而使系数可以从实验数据中得到。这种EFT方法在性质上类似于PDF的拟合,因为两者都涉及到用一组简化的拟合函数来描述复杂的物理现象。 
虽然量子算法,特别是QML的大部分发展都集中在识别和解决传统方法中存在的计算瓶颈,但这些基准应用所确定的目标是利用QML模型的特性,以新的方式更好地解释来自实验高能物理的数据。为实现这一目标,已经开始了一些研究,但是这些初步的步骤仅仅提供了一些提示,还没有完全了解如何利用QML来对粒子物理实验数据中包含的信息进行量子解释
4)用于模拟的生成式模型
生成式模型的其他自然应用是探测器模拟和事件生成。 
对撞机探测器事件的蒙特卡罗模拟是实验数据处理链中计算成本最高的任务之一。最近的估计表明,大型强子对撞机计算网格(WLCG)的50%以上直接用于仿真任务或用于仿真数据的重新构建,即从仿真数据中提取高级特征。高亮度强子对撞机的下一代探测器和未来的对撞机,由于其尺寸更大、传感器粒度更高、复杂性更高,对数据模拟和重构的计算资源的要求将更高。多年来,这一事实引发了对替代方法的深入研究,与基于蒙特卡罗的高精度仿真相比,这些方法通常被称为快速仿真策略。
快速仿真通常以某种程度的精确性换取速度,依赖于探测器响应的参数建模,或最近的深度生成模型,学习多维条件概率分布。 
与此同时,一些研究已经开始研究生成模型的量子(或量子-经典混合)实现。在大多数情况下,受经典模型启发的量子架构得到了研究:例如,量子生成对抗网络(QGAN)或QAE的实现。特别有趣的是量子电路玻恩机(Quantum Circuit Born Machine,QCBM),它是量子生成模型,在采样过程中利用玻恩定则。 
与经典领域一样,量子架构被用于解决两类主要应用:探测器输出模拟和最终状态生成。在这两种情况下,特别是探测器输出模拟,当前模型的主要局限性在于模拟结果的维度。粒子物理探测器的实际应用需要生成模型来学习其大小与探测器传感器数量成比例的分布。
目前的模型可以为非常小(10个大小)的设置生成精确的模拟,使用一个量子比特代表一个探测器传感器。通常情况下,可逆数据压缩技术(如自动编码器)可用于将原始模拟缩小到量子系统可管理的大小:经典编码器网络产生一个缩小的潜在表示,然后由量子生成模型学习。然而,很明显,在这一领域最有趣的发展需要减少经典数据降维步骤相对于量子算法的权重。 
除了探测器的大小,分解的需要也影响了基于量子生成模型的仿真的逼真度。在这种情况下,应特别注意正确描述粒子间的交叉相关性,从而获得良好的连通性和再现复杂纠缠的可能性。

本文描述了来自实验和理论高能物理的应用,在这些应用中,量子计算有可能显示出比经典计算更好的性能。 
我们注意到,所给出的应用绝不是完整的,应该作为高能物理界非常感兴趣的例子。原文中,研究团队表示,“这项工作应作为目前作者探索量子计算在高能物理中的潜力的第一步,我们期望从事这方面工作的高能物理学家群体在未来将大幅增长。”
关于为理论部分(IIIA)概述的应用而提出的量子算法,此篇综述将量子动力学确定为主要目标之一,因为它与高能物理领域相关,例如散射现象、弦断裂、淬火或相变的动力学特性。事实上,相应经典方法的成本按指数增长,再加上良好调谐的量子算法的可用性,使得量子计算成为解决量子动力学问题的一个非常有前途的工具。除了理论HEP模型应用的动态方面,团队还描述了量子计算可以带来更好性能的静态情况。这些包括非等价和非等价晶格规理论,提供拓扑项或非零费米子密度或中微子振荡等。在这些情况下,量子计算显然比经典的马尔可夫链蒙特卡罗方法更具优势
虽然在这些情况下量子计算比经典的马尔可夫链蒙特卡罗方法有明显的优势,但它是否比张量净工作方法有优势还有待观察。
除了本文所考虑的低二维模型本身,用量子计算来研究它们也可以极大地帮助发展研究(3+1)D对应模型的算法和方法。而且,探索QCD的前人未曾探索过的阶段,如非常早期的宇宙或拓扑项的强度变大时,是一个非常迷人的前景。此外,它将允许在一个完全非微扰的快速离子中研究散射现象,为粒子对撞物理学打开全新的视角,并阐明QCD的约束相向夸克胶子等离子体的转变。
如前文所述,QC在量子模拟和HEP实验工作流程中将有广泛的应用。在实验方面,QML是在信号处理和探测器重建等应用中利用量子计算的主要技术。然而,当考虑用QML处理经典实验数据时,将数据编码到量子电路中是一个巨大的挑战,特别是对于未来的对撞机,将产生大量的数据。此外,数据编码也是导致“贫瘠高原”的关键过程之一。
这促使科学家探索在未来利用量子数据的可能性,将其作为直接利用量子模拟和HEP实验数据中编码的量子特性的一种有前途的途径。
从长远来看,人们可以进行量子实验,不仅是数字量子模拟,还可以进行模拟量子模拟或其他实验,然后通过量子传感器测量最终状态,并将状态相干地传输到量子计算机,由计算机执行QML以提取物理信息。这种混合系统可以扩展到量子增强HEP实验的概念。
在NISQ时代,该项目成功的“必要条件”是共同设计误差缓解方案,有效补偿不同的噪声源(如栅极误差、量子比特退相干和串扰),并保证足够质量的结果,以提取感兴趣的物理现象。为此,过去几年中提出了几种误差缓解方案,包括零噪声外推法、概率误差消除法,以及最近应用于具有100多个位点的跨场伊辛模型动力学的概率误差放大法。所有这些方法都需要精确描述当前器件的所有噪声源,而这正是一个非常活跃和成功的研究领域。
最后,大多数量子算法的精度将取决于测量过程的质量。精确的结果可能需要大量的投影测量,这很容易超过目前的门时间(从超导量子比特的约几毫微秒到离子技术的几毫微秒),这决定了量子计算硬件计算的时钟速度。同样在这种情况下,论文表示:“我们需要设计出能够减少测量开销的新方法,为量子计算在大规模模拟中的应用开辟新的途径。”
关于高能物理量子计算工作组
高能物理量子计算(QC4HEP)工作组的首次活动汇聚了来自四大洲、不同学术研究机构和国家的高能物理专家,他们不仅是高能物理理论和实验方面的世界级专家,还对量子计算(QC)及其改变该领域游戏规则的潜力有着共同的兴趣。

相关阅读:
量子物理与经典物理边界:纳米粒子二维量子冻结
亟需打破的 10 大量子神话——
黑洞 = 量子粒子?
IBM量子计算机首次用于模拟高能粒子碰撞

#光子盒视频号开通啦!你要的,这里全都有#

每周一到周五,我们都将与光子盒的新老朋友相聚在微信视频号,不见不散!


|qu|cryovac>
你可能会错过:|qu|cryovac>
|qu|cryovac>
继续滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存